Résolution optimale de DEC-POMDPs par recherche heuristique
Identifieur interne : 004B10 ( Main/Exploration ); précédent : 004B09; suivant : 004B11Résolution optimale de DEC-POMDPs par recherche heuristique
Auteurs : Daniel Szer [France] ; François Charpillet [France] ; Shlomo Zilberstein [États-Unis]Source :
- Revue d'Intelligence Artificielle [ 0992-499X ] ; 2007.
Abstract
Nous présentons le premier formalisme de recherche heuristique permettant de résoudre les POMDPs décentralisés (DEC-POMDP). Notre algorithme peut être utilisé pour calculer des plans optimaux dans des domaines comme la multirobotique ou les réseaux de communication, et ceci à horizon fini comme à horizon infini. Nous présentons ici une nouvelle classe d’algorithmes qui fait le lien entre les méthodes de recherche heuristique classiques et la théorie du contrôle décentralisé. Nous prouvons l’optimalité de ce formalisme dans le cadre des politiques déterministes, et nous évaluons sa performance sur quelques exemples d’applications répandus dans le domaine du contrôle décentralisé.
We present the first generalized heuristic search formalism that is able to solve decentralized POMDPs of both finite and infinite horizon. Our algorithm is suitable for computing optimal plans for a cooperative group of agents that operate in a stochastic environment. These problems arise in domains such as multi-robot coordination, or network traffic control. We present a framework that is based on classical heuristic search on the one hand, and on decentralized control theory on the other hand. We prove that our approach is able to generate optimal deterministic controllers, and we study its performance on examples from the literature.
Url:
DOI: 10.3166/ria.21.107-128
Affiliations:
- France, États-Unis
- Grand Est, Lorraine (région), Massachusetts
- Amherst (Massachusetts)
- Université du Massachusetts à Amherst
Links toward previous steps (curation, corpus...)
- to stream Istex, to step Corpus: 000E59
- to stream Istex, to step Curation: 000E47
- to stream Istex, to step Checkpoint: 000E91
- to stream Main, to step Merge: 004C44
- to stream Hal, to step Corpus: 006547
- to stream Hal, to step Curation: 006547
- to stream Hal, to step Checkpoint: 003B93
- to stream Main, to step Merge: 004F07
- to stream Main, to step Curation: 004B10
Le document en format XML
<record><TEI wicri:istexFullTextTei="biblStruct"><teiHeader><fileDesc><titleStmt><title xml:lang="fr">Résolution optimale de DEC-POMDPs par recherche heuristique</title>
<author><name sortKey="Szer, Daniel" sort="Szer, Daniel" uniqKey="Szer D" first="Daniel" last="Szer">Daniel Szer</name>
</author>
<author><name sortKey="Charpillet, Francois" sort="Charpillet, Francois" uniqKey="Charpillet F" first="François" last="Charpillet">François Charpillet</name>
</author>
<author><name sortKey="Zilberstein, Shlomo" sort="Zilberstein, Shlomo" uniqKey="Zilberstein S" first="Shlomo" last="Zilberstein">Shlomo Zilberstein</name>
</author>
</titleStmt>
<publicationStmt><idno type="wicri:source">ISTEX</idno>
<idno type="RBID">ISTEX:3E1980D7F90A8F33396C15CEDEEB3429AD98178F</idno>
<date when="2007" year="2007">2007</date>
<idno type="doi">10.3166/ria.21.107-128</idno>
<idno type="url">https://api.istex.fr/ark:/67375/HT0-B2V0R924-2/fulltext.pdf</idno>
<idno type="wicri:Area/Istex/Corpus">000E59</idno>
<idno type="wicri:explorRef" wicri:stream="Istex" wicri:step="Corpus" wicri:corpus="ISTEX">000E59</idno>
<idno type="wicri:Area/Istex/Curation">000E47</idno>
<idno type="wicri:Area/Istex/Checkpoint">000E91</idno>
<idno type="wicri:explorRef" wicri:stream="Istex" wicri:step="Checkpoint">000E91</idno>
<idno type="wicri:doubleKey">0992-499X:2007:Szer D:resolution:optimale:de</idno>
<idno type="wicri:Area/Main/Merge">004C44</idno>
<idno type="wicri:source">HAL</idno>
<idno type="RBID">Hal:inria-00119482</idno>
<idno type="url">https://hal.inria.fr/inria-00119482</idno>
<idno type="wicri:Area/Hal/Corpus">006547</idno>
<idno type="wicri:Area/Hal/Curation">006547</idno>
<idno type="wicri:Area/Hal/Checkpoint">003B93</idno>
<idno type="wicri:explorRef" wicri:stream="Hal" wicri:step="Checkpoint">003B93</idno>
<idno type="wicri:doubleKey">0992-499X:2007:Szer D:resolution:optimale:de</idno>
<idno type="wicri:Area/Main/Merge">004F07</idno>
<idno type="wicri:Area/Main/Curation">004B10</idno>
<idno type="wicri:Area/Main/Exploration">004B10</idno>
</publicationStmt>
<sourceDesc><biblStruct><analytic><title level="a" type="main" xml:lang="fr">Résolution optimale de DEC-POMDPs par recherche heuristique</title>
<author><name sortKey="Szer, Daniel" sort="Szer, Daniel" uniqKey="Szer D" first="Daniel" last="Szer">Daniel Szer</name>
<affiliation wicri:level="3"><country xml:lang="fr">France</country>
<wicri:regionArea>Equipe MAIA, INRIA-LORIA, B.P.239, 54506Vandœuvre-lès-Nancy</wicri:regionArea>
<placeName><region type="region" nuts="2">Grand Est</region>
<region type="old region" nuts="2">Lorraine (région)</region>
</placeName>
</affiliation>
<affiliation wicri:level="1"><country wicri:rule="url">France</country>
</affiliation>
</author>
<author><name sortKey="Charpillet, Francois" sort="Charpillet, Francois" uniqKey="Charpillet F" first="François" last="Charpillet">François Charpillet</name>
<affiliation wicri:level="3"><country xml:lang="fr">France</country>
<wicri:regionArea>Equipe MAIA, INRIA-LORIA, B.P.239, 54506Vandœuvre-lès-Nancy</wicri:regionArea>
<placeName><region type="region" nuts="2">Grand Est</region>
<region type="old region" nuts="2">Lorraine (région)</region>
</placeName>
</affiliation>
<affiliation wicri:level="1"><country wicri:rule="url">France</country>
</affiliation>
</author>
<author><name sortKey="Zilberstein, Shlomo" sort="Zilberstein, Shlomo" uniqKey="Zilberstein S" first="Shlomo" last="Zilberstein">Shlomo Zilberstein</name>
<affiliation wicri:level="4"><country xml:lang="fr">États-Unis</country>
<wicri:regionArea>Department of Computer Science, University of Massachusetts Amherst, Amherst, MA01003</wicri:regionArea>
<placeName><region type="state">Massachusetts</region>
<settlement type="city">Amherst (Massachusetts)</settlement>
</placeName>
<orgName type="university">Université du Massachusetts à Amherst</orgName>
</affiliation>
<affiliation wicri:level="1"><country wicri:rule="url">États-Unis</country>
</affiliation>
</author>
</analytic>
<monogr></monogr>
<series><title level="j" type="main">Revue d'Intelligence Artificielle</title>
<title level="j" type="abbrev">Rev. Int. Artificielle</title>
<idno type="ISSN">0992-499X</idno>
<idno type="eISSN">1958-5748</idno>
<imprint><publisher>Lavoisier</publisher>
<date type="published" when="2007-01">2007</date>
<biblScope unit="vol">21</biblScope>
<biblScope unit="issue">1</biblScope>
<biblScope unit="page" from="107">107</biblScope>
<biblScope unit="page" to="128">128</biblScope>
<biblScope unit="page-count">128</biblScope>
<biblScope unit="ref-count">0</biblScope>
<biblScope unit="fig-count">0</biblScope>
<biblScope unit="table-count">0</biblScope>
</imprint>
<idno type="ISSN">0992-499X</idno>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt><idno type="ISSN">0992-499X</idno>
</seriesStmt>
</fileDesc>
<profileDesc><textClass><keywords scheme="mix" xml:lang="it"><term>DEC-POMDP</term>
<term>Markov Decision Processes</term>
<term>decentralized control</term>
<term>planning</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front><div type="abstract" xml:lang="fr">Nous présentons le premier formalisme de recherche heuristique permettant de résoudre les POMDPs décentralisés (DEC-POMDP). Notre algorithme peut être utilisé pour calculer des plans optimaux dans des domaines comme la multirobotique ou les réseaux de communication, et ceci à horizon fini comme à horizon infini. Nous présentons ici une nouvelle classe d’algorithmes qui fait le lien entre les méthodes de recherche heuristique classiques et la théorie du contrôle décentralisé. Nous prouvons l’optimalité de ce formalisme dans le cadre des politiques déterministes, et nous évaluons sa performance sur quelques exemples d’applications répandus dans le domaine du contrôle décentralisé.</div>
<div type="abstract" xml:lang="en">We present the first generalized heuristic search formalism that is able to solve decentralized POMDPs of both finite and infinite horizon. Our algorithm is suitable for computing optimal plans for a cooperative group of agents that operate in a stochastic environment. These problems arise in domains such as multi-robot coordination, or network traffic control. We present a framework that is based on classical heuristic search on the one hand, and on decentralized control theory on the other hand. We prove that our approach is able to generate optimal deterministic controllers, and we study its performance on examples from the literature.</div>
</front>
</TEI>
<affiliations><list><country><li>France</li>
<li>États-Unis</li>
</country>
<region><li>Grand Est</li>
<li>Lorraine (région)</li>
<li>Massachusetts</li>
</region>
<settlement><li>Amherst (Massachusetts)</li>
</settlement>
<orgName><li>Université du Massachusetts à Amherst</li>
</orgName>
</list>
<tree><country name="France"><region name="Grand Est"><name sortKey="Szer, Daniel" sort="Szer, Daniel" uniqKey="Szer D" first="Daniel" last="Szer">Daniel Szer</name>
</region>
<name sortKey="Charpillet, Francois" sort="Charpillet, Francois" uniqKey="Charpillet F" first="François" last="Charpillet">François Charpillet</name>
<name sortKey="Charpillet, Francois" sort="Charpillet, Francois" uniqKey="Charpillet F" first="François" last="Charpillet">François Charpillet</name>
<name sortKey="Szer, Daniel" sort="Szer, Daniel" uniqKey="Szer D" first="Daniel" last="Szer">Daniel Szer</name>
</country>
<country name="États-Unis"><region name="Massachusetts"><name sortKey="Zilberstein, Shlomo" sort="Zilberstein, Shlomo" uniqKey="Zilberstein S" first="Shlomo" last="Zilberstein">Shlomo Zilberstein</name>
</region>
<name sortKey="Zilberstein, Shlomo" sort="Zilberstein, Shlomo" uniqKey="Zilberstein S" first="Shlomo" last="Zilberstein">Shlomo Zilberstein</name>
</country>
</tree>
</affiliations>
</record>
Pour manipuler ce document sous Unix (Dilib)
EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/Main/Exploration
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 004B10 | SxmlIndent | more
Ou
HfdSelect -h $EXPLOR_AREA/Data/Main/Exploration/biblio.hfd -nk 004B10 | SxmlIndent | more
Pour mettre un lien sur cette page dans le réseau Wicri
{{Explor lien |wiki= Wicri/Lorraine |area= InforLorV4 |flux= Main |étape= Exploration |type= RBID |clé= ISTEX:3E1980D7F90A8F33396C15CEDEEB3429AD98178F |texte= Résolution optimale de DEC-POMDPs par recherche heuristique }}
This area was generated with Dilib version V0.6.33. |